机译:使用基于Concutional-LSTM网络的注意力的自然场景图像和视频帧中的脚本识别
机译:基于残余的关注的多尺度脚本识别在现场文本图像中
机译:使用动态形状编码在多脚本场景中的场景图像和视频帧中进行单词搜索
机译:从自然图像/视频识别脚本的十年:回顾
机译:基于混合Curvelet,小波和余弦变换的无参考自然图像/视频质量评估,包括噪点,模糊或压缩图像/视频。
机译:基于卷积神经网络的可见光和热成像摄像机视频对人体图像的性别识别
机译:多脚本场景中的场景图像和视频帧中的单词搜索 使用动态形状编码